Termout.org logo/LING


Update: February 24, 2023 The new version of Termout.org is now online, so this web site is now obsolete and will soon be dismantled.

Lista de candidatos sometidos a examen:
1) corpus del español (*)
(*) Términos presentes en el nuestro glosario de lingüística

1) Candidate: corpus del español


Is in goldstandard

1
paper corpusSignosTxtLongLines401 - : (iv) Cuando el P1 es un ‘emisor’, este se vincula con un P2-enunciado o manifestación observable del ‘decir’, en el marco de un MLRE-verbal. En el corpus del español, empleado en este trabajo, el P2-enunciado se realiza a través de:

2
paper corpusSignosTxtLongLines401 - : Respecto de la realización léxico-gramatical de las funciones de proceso y participantes, en el corpus del español de Chile empleado para observación, se presenta un patrón respecto del continuum de la léxico-gramática: las realizaciones más léxicas son las seleccionadas con mayor frecuencia en casi todos los contextos realizacionales . Se exceptúan el proceso realizado a través de un grupo verbal en el que, como quedó dicho, se prefiere el ‘grupo verbal perifrástico’, realización más cercana al paradigma gramaticalizado de la lengua, el P2-existente y el P3. Desde aquí, se desprende que la ampliación del corpus es una de las primeras proyecciones esta investigación, de modo de observar si el patrón probabilístico descrito está asociado solo al contexto de observación de este estudio o se extiende a otros contextos. Asimismo, sería interesante continuar la caracterización del habla infantil y del habla, en general, en diferentes etapas del desarrollo ontogenético, propiciando una

3
paper corpusSignosTxtLongLines405 - : 5 El presente trabajo se centra exclusivamente en los ejemplos recogidos en el CORDE y el CREA y se descartan otros corpus disponibles como el CDH, el CORPES XXI o el Corpus del Español de Mark Davies, primero, porque el CDH es un corpus con orientación lexicográfica que no sirve como referencia para otros niveles de la lengua, por ello se descarta ; el CORPES XXI, tal y como se define, es una versión provisional en la que no figuran todavía transcripciones de textos orales y en el que se registra solo una pequeña parte de los documentos que lo conformarán, mismos que día con día se va actualizando (RAE, 2013), razón por la cual se ha planteado retomar la normalización de frecuencias para este corpus en trabajos posteriores; y por último, se descarta el Corpus del Español de Mark Davies de este estudio, ya que este corpus cuenta con un método de normalización de frecuencias por millón.

4
paper corpusSignosTxtLongLines565 - : Para realizar el presente estudio, se han recogido ejemplos de uso de la construcción ‘[o] eso dicen’ a partir de la búsqueda por el término ‘eso dicen’. Se han extraído todas las ocurrencias de los siguientes corpus orales: Val.Es.Co. 2.1, CORLEC, la muestra europea del corpus PRESEEA^[102]^7, corpus COSER y la parte oral de CORPES XXI^[103]^8. Estos corpus coinciden en registrar muestras de español oral, aunque difieren en cuanto a la tipología de los textos, puesto que contamos con conversaciones coloquiales y diversos tipos de entrevistas (entrevistas radiofónicas y entrevistas sociolingüísticas semidirigidas). Además, se ha recopilado una muestra de ejemplos del subcorpus escrito Corpus del Español: Web/Dialects . Inicialmente, se ha seleccionado una muestra de 100 ejemplos de los que se descartaron todas aquellas ocurrencias que remitían a páginas no existentes o sitios a los que no se podía acceder a la fecha de las consultas (entre el 30-11-2019 y el 5-12-2019). La elección de e

5
paper corpusSignosTxtLongLines565 - : Escrito Corpus del Español: Web/Dialects 11 23 34 (52,3 % )

6
paper corpusSignosTxtLongLines565 - : Davies, M. (Dir.) (2020). Corpus del Español: Web/Dialects [en línea] . Disponible en: [173]https://www.corpusdelespanol.org/web-dial/ [ [174]Links ]

7
paper corpusSignosTxtLongLines589 - : En este trabajo de corte cuantitativo se analiza el comportamiento de los comparativos sintéticos del español cuando aparecen precedidos de los cuantificadores ‘más’ y ‘menos’. En concreto, a partir de los datos obtenidos del Corpus del español: Web/Dialectos, se da a conocer su distribución geográfica actual, se determina qué formas son las empleadas (y con qué frecuencia ), en qué contextos sintáctico-discursivos aparecen y cómo se perfila su proceso de positivización. Estas combinaciones (documentadas desde antiguo) no son exclusivas de España, sino que se emplean también plenamente en las variedades americanas. Las pruebas que muestran el proceso de ‘positivización’ son varias: los comparativos sintéticos se documentan combinados con el modificador de grado ‘muy’ (‘muy mayor’/ ‘menor’/ ‘mejor’/ ‘peor’); admiten la derivación en ‘-mente’ (‘mejormente’, ‘peormente’, ‘mayormente’, ‘menormente’), así como la coordinación con otro adjetivo

8
paper corpusSignosTxtLongLines589 - : This paper takes a quantitative approach to analyzing the behavior of Spanish synthetic comparatives when they are preceded by the quantifiers más and menos. In particular, taking the data obtained from the Corpus del español: Web/Dialectos, we give an account of their current geographical distribution, as well as we determine what forms are used (and how often ), in what syntactic-discursive contexts they appear and how their positivization process is outlined. These combinations (documented since ancient times) are not exclusive to Spain, but are also used in some American Spanish varieties. Several tests support the process of 'positivization': the synthetic comparatives are documented combined with the degree modifier muy (muy mayor/ menor/ mejor/ peor); they allow -mente derivation (mejormente, peormente, mayormente, menormente), as well as coordination with another adjective in comparative constructions (más mejor y más larga). In addition, we show that the lexicalization of mayor as a

9
paper corpusSignosTxtLongLines589 - : El corpus empleado en esta investigación, centrada en el español actual, es el Corpus del español: Web/Dialectos, base de datos que alberga más de dos mil cien millones de palabras procedentes de páginas web de los 21 países de habla hispana publicadas entre 2013 y 2014 . Las búsquedas de las formas, en todos los países, se realizaron entre los meses de agosto y octubre de 2018. A este respecto, hay que matizar una serie de hechos. En primer lugar, dado que ‘más mayor’ es una construcción admitida ya por la academia (Mi hermano Pedro es más mayor que tú), no formó parte de las búsquedas. Por otro lado, dejamos también fuera de este estudio los casos de ‘cuanto’/ ‘contra’/ ‘mientras más mejor ‘y los casos de ‘por lo menos’/ ‘al menos, mejor que’..., es decir, las oraciones comparativas proporcionales o correlativas. Por lo que respecta a los ejemplos que presentamos, mantenemos la grafía original que figura en el corpus en todos los casos e indicamos el país de origen

10
paper corpusSignosTxtLongLines589 - : En este trabajo hemos revisado la aparición de los comparativos sintéticos ‘mejor’, ‘peor’, ‘mayor’ y ‘menor’ en construcciones comparativas con los adverbios ‘más’ y ‘menos’. A partir de los datos procedentes del Corpus del español: Web/Dialectos, hemos mostrado que la combinación de ‘más’ y ‘menos’ con un comparativo sintético no se limita al caso de ‘mayor’, fenómeno habitualmente tratado en la bibliografía y aceptado desde el punto de vista normativo, sino que se da también con los otros tres comparativos sintéticos .

11
paper corpusSignosTxtLongLines589 - : ^2Según los datos del Corpus del español: Web/Dialectos, la forma ‘mayor’ se registra 1 244 974 veces (1 013 057 en singular y 231 917 en plural ), ‘menor’ 411 396 (274 227 en singular y 137 169 en plural), ‘mejor’ 1 962 073 (1 606 166 en singular y 355 907 en plural) y ‘peor’ 296 166 (251 614 en singular y 445 52 en plural).

Evaluando al candidato corpus del español:



corpus del español
Lengua:
Frec: 52
Docs: 24
Nombre propio: 9 / 52 = 17%
Coocurrencias con glosario:
Puntaje: 0.149 = ( + (1+0) / (1+5.7279204545632)));
Candidato aceptado

Referencias bibliográficas encontradas sobre cada término

(Que existan referencias dedicadas a un término es también indicio de terminologicidad.)
corpus del español
: CORPES = Real Academia Española: Banco de datos (CORPES) Corpus del Español del Siglo XXI [en línea]. Disponible en: [250]http://web.frl.es/CORPES/
: Criado de Diego, C. (2017). Pluralización de ‘haber’ existencial en el Corpus del español del siglo XXI. CLAC, 76, 117-128.
: Real Academia Española (2015). Corpus del español del siglo XXI [on line]. Retrieved from: [238]http://web.frl.es/CORPES/view/inicioExterno.view
: Real Academia Española (s.f). Banco de datos (CORPES XXI). Corpus del Español del Siglo XXI (CORPES) [en línea]. Disponible en: <[137]http://www.rae.es>